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(57) Abstract: The invention relates 
to a protein mixture containing at least 
one first fusion protein containing 
a protein or a protein fragment, an 
interaction domain, and a protein 
translocation sequence which causes 
the fusion protein to be translocated 
by the cytoplasmatic membrane when 
expressed in a bacterium in an essentially 
unfolded state, and at least one second 
fusion protein containing a protein or a 
protein fragment, an interaction domain, 
and a protein translocation sequence 
which causes the fusion protein to 
be translocated by the cytoplasmatic 
membrane when expressed in a 
bacterium in an essentially folded state. 
The interaction domain of the first fusion 
protein can bind to that of the second 
fusion protein. 

(57) Zusammenfassung: Die 
vorliegende Erfindung betrifft ein 
Proteingemisch, enthaltend mindestens 
ein erstes Fusionsprotein, enthaltend 
ein Protein oder Proteinfragment, 
eine Interaktionsdomane und eine 
Proteintranslokationssequenz, die 
bewirkt, dass das Fusionsprotein bei 
Expression in ein Bakterium in einem im 
wesentlichen ungefalteten Zustand durch 
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transloziert wird, und nundestens ein zweites Fusionsprotein, enthaltend ein Protein oder Proteiniragment, eine Interaktionsdomane 
und eine Proteintranslokationssequenz, die bewirkt, daB das Fusionsprotein bei Expression in einem Bakterium in einem im 
wesenthchen gefaJteten Zustand durch die zytoplasmatische Membran transloziert wird, wobei die Intemktionsdomane des ersten 
rusionsproteins an die des zweiten Fusionsproteins binden kann. 
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Gemisch mindestens zweier Fusionsproteine sowie ihre Herstellung und Verwendung 

Die vorliegende Erfindung betrifft ein Proteingemisch, enthaltend mindestens ein erstes Fusi- 
onsprotein, enthaltend ein Protein oder Proteinfragment, eine Interaktionsdomane und eine 
Proteintranslokationssequenz, die bewirkt, da/3 das Fusionsprotein bei Expression in ein Bak- 
terium in einem im wesentlichen ungefalteten Zustand durch die zytoplasmatische Membran 
transloziert wird, und mindestens ein zweites Fusionsprotein, enthaltend ein Protein oder Pro- 
teinfragment, eine Interaktionsdomane und eine Proteintranslokationssequenz, die bewirkt, 
daB das Fusionsprotein bei Expression in einem Bakterium in einem im wesentlichen gefalte- 
ten Zustand durch die zytoplasmatische Membran transloziert wird, wobei die Interaktions- 
domane des ersten Fusionsproteins an die des zweiten Fusionsproteins binden kann. 

Die Phagendisplay-Technologie wird heutzutage in vielen Bereichen der Biotechnologie zum 
Auftlnden von Proteinen mit gewiinschten Bindungseigenschaften und enzymatischen Aktivi- 
taten verwendet (Forrer, P. et al. (1999) Current Opinion in Struct. Biol. 9:514-520 und Gao, 
C. et al. (2002) Proc. Natl. Acad. Sci. U.S.A. 99:12612-12616). GleichermaBen wird die 
Technologie verwendet, urn beispielsweise die Bindungseigenschaften, die enzymatischen 
Eigenschaften und/oder die thermodynamische Stability von bereits bekannten oder durch die 
Phagendispplay-Technologie isolierten Proteine zu verbessern (Forrer, P. et al. (1999) siehe 
oben). Die Grundlage fur die Phagendisplay-Technologie liegt in der Beobachtung, daB be- 
stimmte sogenannte nicht-lytische Bakteriophagen Bakterien lediglich infizieren und die Pha- 
genpartikel nicht etwa durch Lyse des Bakteriums freisetzen, sondern die einzelnen Bestand- 
teile des Bakteriophagens durch das Zytoplasma ins Periplasma und letztendlich auf die Bak- 
terienzelloberflache transportieren, wo dann der komplette Phage assembliert wird, der sich 
anschlieBend von der Bakterienzelle l6st. Die Fusion eines interessierenden Proteins mit ei- 
nem Phagenhullprotein fiihrt daher zum Export dieses Proteins aus dem bakteriellen Zytop- 
lasma und der Prasentation auf der Oberflache des Bakteriums. Fiir die Prasentation geeignete 
Phagenhullproteine sind beispielsweise die aus dem M13-Phagemid stammenden pill, pVI, 
pVII, pVIH und pDC (Gao, C. et al. (2002) siehe oben). 

Der N-Terminus des Phagenhullproteins ist nach auBen gerichtet, so daB das fusionierte Pro- 
tein N-terminal vom Phagenhullprotein angeordnet sein muB, damit es auf der Phagenoberfla- 



WO 2004/050871 - 2 - 



PCT/EP2003/013709 



10 



15 



che prasentiert wird. Dies fuhrt zu keinem Problem, wenn einzelne bereits bekannte Proteine 
mit einem der genannten Phagenhmlproteinen fusioniert werden sollen, da fur diese Proteine 
START- und STOP-Codons bekannt sind. Es fuhrt jedoch dann zu Problemen, wenn eine 
sogenannte Phagen-Bibliothek hergestellt werden soli, bei der die Phagenhullproteine mit 
einer cDNA-Bibliothek fusioniert werden sollen. Das Problem liegt darin, daB die in cDNA- 
Bibliotheken enthaltenden kodierenden Nukleinsauren in der Regel translationelle STOP- 
Codons am 3'-Ende enthalten da durch die Poly^-Selektion der mRNA und durch das sich 
anschlieBende 01igo-(dT)-priming die resultierenden cDNAs immer die translationellen 
STOP-Codons enthalten. So liegt bei Fusion einer 01igo-(dT)-geprimten cDNA 5' vom Pha- 
genhullprotein immer ein STOP-Codon zwischen der cDNA und dem Phagenhullprotein, 
wodurch wiederum die Expression eines Fusionsproteins aus dem cDNA kodierten Proteiii 
und dem Phagenhullprotein verhindert wird. Daher wurde von Crameri, R. und Suter, M. 
(1993) Gene 137:69-75 ein neuartiges Klonierungs- und Expressionssystem entwickelt, das 
darauf basiert, daB die Interaktionsdomanen der beiden Oncoproteine cJun und cFos, die iiber 
ein Proteinmotiv von gleichmaBig beabstandeten Leuzinresten dem sogenannten „Leuzin- 
Zipper" eine starke Wechselwirkung zwischen den beiden Proteinen ausbilden (Lands'chulz et 
al. (1988) Science 240:1759-64), genutzt werden, urn das jeweils separat exprimierte Phagen- 
hullprotein und das cDNA-kodierte Protein zu einem Heterodimer zu verbinden. Dazu wurde 
von einem LacZ-Promotor gesteuert, ein Fusionsprotein exprimiert, das am N-Terminus aus 
cJun und am C-Terminus aus einem Phagenhullprotein (pin) bestand und ein zweites Fusi- 
onsprotein, das am N-Terminus aus cFos und am C-Terminus aus einer cDNA-Bank bestand, 
wobei auch dieses Protein durch einen zweiten LacZ-Promotor gesteuert wurde. Durch die' 
Interaktion von cJun und cFos iiber die jeweiligen Leuzin-Zipper im Periplasma eines Bakte- 
riums wurde dadurch die Prasentation von Protein bzw. Proteinfragmenten, die durch cDNAs 
25 kodiertsind auf filamentSsen Phagen mSglich. 

Beim Einsatz der Phagendisplay-Technologie gibt es das weitere Problem, daB die Assemb- 
lierung der Phagen und somit auch der Einbau der Fusionsproteine in die Phagenpartikel aus- 
schlieBUch im Periplasma stattfindet (Russel et al. (1997) Gene 192(l):23-32). Urn die jewei- 
ligen Fusionsproteine ins Periplasma der Bakterienzelle zu exportieren, muB demnach gege- 
benenfalls gentechnisch eine Sec-Signalsequenz an das Fusionsprotein angefUgt werden. Die- 
se Signalsequenz bewirkt, daB die Fusionsproteine in einem im wesentlichen ungefalteten 
Zustand ins Periplasma transportiert werden. Eine betrachtliche Anzahl von Proteinen kann 
jedoch nicht mittels des Sec-Transportwegs ins Periplasma gelangen, da sogenannte „Stop- 
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Transfer"-Sequenzen oder eine zu schnelle Faltung des Proteins, die bereits ins Zytoplasma 
erfolgt, einen Transport verbindern. „Stop-Transfer"-Sequenzen bewirken durch eine lokale 
Haufung positiv-geladener Aminosauren in der Proteinsequenz, dafi das entsprechende Prote- 
in bei der Translokation tiber den Sec-Transportweg in der inneren Membran stecken bleibt. 
Proteine, die durch ihre schnelle und/oder stabile Faltung nicht mehr in der entfalteten Form 
von den Proteinen des Sec-Transportweges - insbesondere von SecB - gebunden werden 
konnen, werden nicht zum Sec-Tranlokase-Komplex transportiert und verbleiben im Cy- 
toplasma (Yamane et al. (1988) J. Bio. Chem. 263:19690-19696 und Berks, B. C. (1996) Mol. 
Microbiol. 22:393-404 und Bergs, B. C. et al. (2000) Mol. Microbiol. 35:260-274). Proteine, 
die auf reduzierende Bedingungen oder die fur ihre Funktionsfahigkeit auf zytoplasmatische 
Co-Faktoren, wie beispielsweise FeS-Zentren oder Molybdopterin angewiesen sind, k6nnen 
ebenfalls nicht tiber den Sec-Transportweg in funktioneller Form ins Periplasma gelangen. 
Aufgrund der Inkompatibilitat mit dem Sec-Transportweg konnen demnach viele Polypeptide 
nicht funktionell gefaltet mit dem Phagendisplay prasentiert und anschlieBend selektiert wer- 
den. Die Translokation der Fusionsproteine tiber den Sec-Transportweg ins Periplasma stellt 
daher einen wesentlichen Nachteil der im Stand der Technik bekannten Phagendisplay- 
Techniken dar. 

Aus den unterschiedlichen Anforderung an das zellulare Milieu bei Faltung bestimmter Prote- 
ine ergibt sich ein weiteres Problem bei der Expression von Fusionsproteinen insbesondere in 
Bakterien, wenn der eine Teil des Fusionsproteins nur im Periplasma eine korrekte Faltung 
annimmt, wie das z.B. bei Antikorperproteinen der Fall ist (Gao, C. et al. (2002) siehe oben) 
und der andere Teil des Fusionsproteins nur im Zytoplasma korrekt gefaltet werden kann, wie 
das z.B. beim grun-floreszierenden Protein (GFP) der Fall ist, das Sec-inkompatibel ist. So ist 
z.B. die Expression von Antik6rper-GFP-Fusionsprotein, d.h. von Fluoreszenz-markierten 
Antikorpermolekulen, in Bakterien bisher nicht mSglich. Die Beschrankung auf den Sec- 
Transportweg verhindert somit die Herstellung einer Vielzahl interessanter Proteinkonjugate 
insbesondere in Bakterien. 

Eine Aufgabe der vorliegenden Erfindung besteht daher darin die Einschrankung der im Stand 
der Technik bekannten Phagendisplay-Technologie auszuraumen und die Herstellung von 
Fusionsproteinen zu ermoglichen, die bei Herstellung durch die im Stand der Technik be- 
kannten Verfahren nicht zu funktionellen Fusionsproteinen ftihren. 
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Die vorliegende Erfindung stellt daher in einem Aspekt ein Proteingemisch zur Verfugung, 
enthaltend: a) mindestens ein erstes Fusionsprotein, enthaltend: i) ein Protein oder Protein- 
fragment, ii) eine Interaktionsdomane und iii) eine Proteintranslokationssequenz, die bewirkt, 
daB das Fusionsprotein bei Expression in einem Bakterium in einem im wesentUchen ungefal- 
teten Zustand durch die zytoplasmatische Membran transloziert wird, und b) mindestens ein 
zweites Fusionsprotein, enthaltend: i) ein Protein oder Proteinfragment, ii) eine Interaktions- 
domane und iii) eine Proteintranslokationssequenz, die bewirkt, daB das Fusionsprotein bei 
Expression in einem Bakterium in einem im wesentUchen gefalteten Zustand durch die zy- 
toplasmatische Membran transloziert wird, wobei die Interaktionsdomane des ersten Fusions- 
proteins an die des zweiten Fusionsproteins binden kann. 

Das Protein oder Proteinfragment des ersten Fusionsproteins umfaBt vorzugsweise Proteine, 
die im ungefalteten Zustand durch die zytoplasmatische Membran eines Bakteriums, vor- 
zugsweise eines Gram-negativen Bakteriums transloziert werden konnen und die demnach 
nicht fur ihre korrekte Faltung auf das reduzierende zytoplasmatische Milieu und/oder auf 
zytoplasmatische Co-Faktoren angewiesen sind und die auch im Periplasma eine im wesentU- 
chen korrekte Faltung erreichen konnen. Beispiele solcher Proteine umfassen, sind aber nicht 
limitiert auf schwere ImmunoglobuUnketten, leichte Immunoglobulinketten, Fragmente dieser 
Ketten, sogenannte „Single-Chain-Antik6rper" (Bird, R. E. (1988)Science 242:423-6), Dia- 
bodies (Holliger, P. (1993) Proc. Natl. Acad. Sci. U.S. A 90(14):6444-8, Rezeptoren, vor- 
zugsweise extrazellulare Domanen von Rezeptoren, wie beispielsweise, EGFR, PDGFR oder 
VEGFR, oder Rezeptorliganden, wie beispielsweise EGF, PDGF oder VEGF, Integrine, vor- 
zugsweise deren extrazellulare Domanen, Intimine und deren Domanen, wie beispielsweise 
EaeA, Kohlenhydrat-bindende Proteine und Domanen davon, wie MBP und CBD, Albumin- 
bindende Proteine und Domanen oder Protein A und dessen Domanen. 

Das Protein oder Proteinfragment des zweiten Fusionsproteins kann ein beliebiges Protein 
oder Proteinfragment sein, bevorzugt sind jedoch Proteinfragmente, die ihre Faltung und/oder 
ihre Funktion nur dann erhalten, wenn sie sich bereits im Zytoplasma eines Bakteriums falten 
und daher in einen im wesentUchen gefalteten Zustand durch die zytoplasmatische Membran 
in das Periplasma transloziert werden. Beispiele solcher Proteine sind autofluoreszierende 
Proteine, wie beispielsweise GFP oder Varianten davon mit veranderten Absorptionsmaxima, 
Enzyme, wie beispielsweise p-Lactamase, Cofaktor-abhangige Proteine, wie beispielsweise 
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TMAO-Reduktase und Meerrettich-Peroxidase, Proteine, die von einer cDNA kodiert werden, 
welche aus einer cDNA-Bibliothek stammt, oder synthetische Proteine. 

In einer bevorzugten AusfUhrungsform ist das Protein oder Proteinfragment des ersten Fusi- 
onsproteins und die Proteintranslokationssequenz ein Phagenhullprotein oder ein periplasma- 
tisches Markerenzym, wie PhoA, ein Intimin ein Protein der aufieren Bakterienmembran oder 
ein periplasmatisches Rezeptorprotein, insbesondere ein Kohlenhydrat-bindendes Protein. 
Bevorzugte Phagenhullproteine, die in einem Proteingemisch der vorliegenden Erfindung 
enthalten sein konnen, sind ausgewahlt aus den M13-Phagemid Hullproteinen pHI, pVI, pVII, 
pVIII und pDC. Von diesen Phagenhullproteinen sind jedoch nur pDI und pVIH mit einer be- 
kannten Sec-abhangigen Proteintranslokationssequenz versehen, wobei die in den restlichen 
Phagenhullproteinen enthaltenden Proteintranslokationssequenzen noch nicht identifiziert 
worden sind. Da diese Phagenhullprotein dennoch in einem im wesentlichen ungefalteten 
Zustand in das Periplasma des Bakteriums transportiert werden, werden solche Proteine im 
Sinnde der Erfindung auch ohne Identifikation der Proteintranslokationssequenz als Proteine 
angesehen, die aus einem Protein oder Proteinfragment und einer Proteintranslokationsse- 
quenzen bestehen. 
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Die mteraktionsdomanen, die in dem ersten und zweiten Fusionsprotein verwendet werden, 
fiihren zur Bindung des ersten Fusionsproteins an das zweite Fusionsprotein. Bevorzugt sind 
hierbei mteraktionsdomanen, die zu einer relativ festen Interaktion der beiden Proteine fuh- 
ren, wobei eine relativ feste Interaktion eine Interaktion ist, die auch im oxidativen Milieu des 
Periplasms, auf der Bakterienzelloberflache oder bei des Sezernierung des Heterodimers 
Oder Heteromultimers auch auBerhalb der Zelle bestehen bleibt. Geeignete Interaktionsdoma- 
nen des ersten und zweiten Fusionsproteins, die erfindungsgemaB in den Fusionsproteinen 
enthalten sein kSnnen, sind beispielsweise eine Leuziniipper-Domane und eine Leuzin- 
Zipper-Domane, wie sie zuerst in den zwei Oncoproteinen cJun und cFos beschrieben wurden 
(Landschulz et al. (1988) siehe oben) Varianten davon aus anderen Hetero- oder Homodime- 
ren sowie artifizielle Leuzin-Zipper-Domanen oder eine Helix-Loop-Helix-Domane und eine 
Helix-Loop-Helix-Domane (Moor et al. (1989) Cell 56:777-783), ein Calmodulin und ein 
Calmodulin-bindendes Peptid (Montigiani, S. et al. (1996) JMB 258:6-13) oder jeweils ein 
Peptid eines Peptid-Dimers. Der Begriff Interaktionsdomanen umfaBt auch Domanen die eine 
Multimerisierung von mehr als zwei Fusionsproteinen erlauben. 
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Die Proteinlranslokationssequenz des ersten Fusionsproteins bewirkt, dafi das Fusionsprotein 
bei Expression in einem Bakterium, vorzugsweise in einem Gram-negativen Bakterium in 
einem im wesentlichen ungefalteten Zustand durch die zytoplasmatische Membran in das Pe- 
riplasma transloziert wird. Der Fachmann ist ohne weiteres in der Lage, entsprechende Prote- 
intranslokationssequenzen aufzufinden, wobei er sich des folgenden Experiments bedienen 
kann. Eine potentielle als Proteintranslokationssequenz geeignete Proteinsequenz, die zur 
Translokation eines damit fusionierten Proteins in einem im wesentlichen ungefalteten Zu- 
stand ftihrt, wird mit einem ein GFP-myc-TAG enthaltenden Protein fusioniert. Wenn die 
potentielle Proteintranslokationssequenz nicht zur Proteintranslokation ins Periplasma ftihrt, 
wird das GFP-Protein im Zytoplasma des Bakteriums gebildet, was sich iiber die zytoplasma- 
tische Fluoreszenz nachweisen laBt, es gelangt dann jedoch nicht an die Oberflache oder ins 
Medium, so dafi der Myc-TAG durch einen anti-Myc-Antik5rper bspw. den monoklonalen 
Antikorper 9E10 weder im Medium noch auf der Oberflache nachweisbar ist. Fuhrt die Se- 
quenz jedoch zur Translokation des Fusionsproteins ins Periplasma und schliefilich zur Pra- 
sentation auf der Oberflache bzw zur Sezernierung in die Umgebung des Bakteriums, so lafit 
sich das prasentierte bzw. sezernierte GFP-myc-TAG-Fusionsprotein durch einen Anti-myc- 
Antikorper im Medium und/oder auf der Oberflache des Bakteriums nachweisen. Gleichzeitig 
sollte im Periplasma in diesem Fall keine Fluoreszenz beobachtet werden konnen, da bei 
Translokation des GFPs ins Periplasma in einem im wesentlichen ungefalteten Zustand sich 
das Protein dort nicht mehr korrekt faltet (sogenannte ..Sec-Inkompatibilitat"). Die Prote- 
intranslokationssequenzen die bevorzugt im ersten Fusionsprotein verwendet werden sind 
solche, die in dem Sec-abhangigen Transportweg (Danese, P. N. und Silhavy, T. J. (1998) 
Annu. Rev. Genet. 32:59-94), die in dem SRP-abhangigen Transportweg (Meyer, D I et al 
(1982) Nature 297:647-650) oder die in einem YidC-abhangigen Transportweg erkannt wer- 
den (Samuelson, J. C. et al. (2000) Nature 406:637-641). Allerdings kann es sich auch um 
eine Transportweg-unabhangige Sequenz handeln. Besonders geeignete Proteintranslokati- 
onssequenzen sind daher beispielsweise Signalsequenzen des PhoA, PelB, OmpA und pill. 

Als weiterer Bestandteil enthalt das zweite Fusionsprotein eine Proteintranslokationssequenz, 
die bewirkt, dafi das Fusionsprotein bei Expression in einem Bakterium, vorzugsweise in ei- 
nem Gram-negativen Bakterium, in einem im wesentlichen gefalteten Zustand durch die zy- 
toplasmatische Membran transloziert wird. Eine Proteintranslokationssequenz mit dieser Ei- 
genschaft liegt dann vor, wenn ein Protein, beispielsweise GFP, das nur im Zytoplasma des 
Bakteriums seine funktionelle Konformation einnehmen kann, ohne Verlust der Autoflures- 
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zenz ins Periplasma transportiert wird. Diese Eigenschaft der erfindungsgemafien Prote- 
intranslokationssequenz laBt sich mit dem vorangehend im Hinblick auf die erste Prote- 
intranslokationssequenz beschriebenen Experiment, untersuchen. Mit einem ahnlichen Expe- 
riment wurde bereits ein Konsensusmotiv ftir das Tat-spezifische Fiihrungspeptid des Twin- 
Argenine-Translokation-(Tat)-Transportwegs von Bakterien vmd Pflanzenchloroplasten ermit- 
telt. Der im Stand der Technik bekannte Tat-Transportweg erlaubt den Transport von bereits 
im Zytoplasma gefalteten Proteinen ins Periplasma und kann somit Proteine, die mit dem Sec- 
Transportweg inkomatibel sind, ins Periplasma transportieren. Genau wie der Transport ttber 
den Sec-Transportweg, wird auch der Tat-Transprotweg durch eine spezielle Gruppe von 
Fuhrungssequenzen vermittelt (DeLisa, M. P. et al. (2002) J. Biol. Chem. 277:29825-29831). 
Ein weiterer im Stand der Technik bekannter Transportweg, der den Transport von Proteinen 
in im wesentlichen gefalteten Zustand erlaubt, ist der uber Thylakoid-Membranen (Settles, A. 
M. und Martienssen, R. (1998) Transcell Biol. 8:494-501). Daher enthalt das zweite Fusions- 
protein in einer bevorzugten Ausfuhrungsform der vorliegenden Erfindung eine Signalse- 
quenz, die von einem Tat-abhangigen Transportweg oder von einem Thylakoid-Aph- 
abhangigen Transportweg erkannt wird und dadurch zur Translokation des Fusionsproteins in 
im wesentlichen gefalteten Zustand ftthrt. Ein Konsensusmotiv einer Proteintranslokationsse- 
quenz, das von einem Tat-abhangigen Transportweg erkannt wird, ist in DeLisa, M. P. et al. 
((2002) siehe oben) beschrieben worden. Die Sequenz lautet: S/T/RRXFLK. 

In einer bevorzugten Ausfuhrungsform des erfindungsgemaBen Proteingemisches sind min- 
destens ein erstes und mindestens ein zweites Fusionsprotein aneinander kovalent oder nicht- 
kovalent gebunden. Zur Erreichung einer kovalenten Bindung der zwei getrennt exprimierten 
Fusionsproteine kQnnen beispielsweise in dem Protein zusatzlich nahe der Interaktionsdoma- 
ne Cysteinreste oder Homologe davon angeordnet werden, die im oxidativen Milieu des Pe- 
riplasmas eine kovalente Bindung zwischen den beiden Fusionsproteinen herstellen. Eine ko- 
valente Bindung kann jedoch beispielsweise auch durch die Inkorporation von Aminosauren 
mit Foto-aktivierbaren Gruppen in die beiden Fusionsproteine und anschliefiende UV- 
Exposition der zunachst lediglich nicht-kovalent aneinander gebundenen Protein erreicht 
werden. Dem Fachmann sind weitere Verfahren bekannt, urn zwei zunachst allein durch 
nicht-kovalente Bindung verbundene Proteine miteinander zu verbinden. Zu diesem dem 
Fachmann bekannten Verfahren der kovalenten Verbindung zweier nicht-kovalent- 
gebundener Fusionsproteine zahlt beispielsweise das Psoralen-Crosslinking. 
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Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Nukleinsauregemisch, das fur ein 
erfindungsgemaBes Proteingemisch kodiert. Eine kodierende Nukleinsaure, im Sinne der Er- 
findung ist ein Nukleinsauresequenz, die fur ein erfindungsgemaBes Polypeptid oder einen 
Vorlaufer davon kodiert. Bevorzugterweise handelt es sich bei dem Nukleinsauregemisch urn 
DNA oder RNA, vorzugsweise urn eine DNA, wobei die DNA einzelstrangig oder dop- 
pelstrangig vorliegen kann. Die jeweils fur das erste oder zweite Fusionsprotein kodierende 
Nukleinsaure enthalt des weiteren Promotoren, die die Expression des jeweiligen Fusionspro- 
teins in der Wirtszelle ermSglichen. Geeignete Promotoren fiir die Expression in beispielswei- 
se E. coli sind der trp-Promotor, lacZ-Promotor, tet-Promotor, T7-Promotor oder ara- 
Promotor. Weitere Elemente, die in den jeweiligen, das Nukleinsauregemisch ausmachenden 
Nukleinsauren vorhanden sein konnen, sind Replikationsurspriinge (Ori), selektive Markerge- 
ne, die beispielsweise Ampizilin- oder Chloramphenikolresistenz vermitteln. Die Nukleinsau- 
ren konnen neben dem fur das jeweilige Fusionsprotein kodierenden Bereich, die iiblicher- 
weise in bakteriellen Expressionsvektoren verwendeten Elemente aufweisen. Dem Fachmann 
sind eine Vielzahl solcher Elemente sowie Vektoren bekannt, wie beispielsweise pGEM oder 
pUC. 



In einer bevorzugten Ausfuhrungsformen des Nuklemsauregemisches der vorliegenden Erfin- 
dung, sind die zwei Nukleinsauren, die fur das erste und zweite Fusionsprotein kodieren, ko- 
valent miteinander verbunden, vorzugsweise tiber Phosphordiester-Bindungen. Insbesondere 
sind die Nukleinsauremolekule, die fur das erste und zweite Fusionsprotein kodieren und ge- 
eignete regulatorische Elemente enthalten, auf einem Plasmid enthalten, so daB die erfin- 
dungsgemaBen Proteingemische bereits durch Transfektion nur eines Plasmids bzw. wenn 
diese Nukleinsaure in einem Phagen enthalten ist, durch Infektion mit nur einem Phagen bei- 
spielsweise in einem Bakterium hergestellt werden konnen. In einer bevorzugten Ausftth- 
rungsform werden beide Fusionsprotein unter der Kontrolle nur eines Promotors als bicistro- 
nische Kassette exprimiert. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Vektor, enthaltend ein erfin- 
dungsgemaBes Proteingemisch und/oder enthaltend ein erfindungsgemaBes Nukleinsaurege- 
misch. Ein Vektor, im Sinne der vorliegenden Erfindung, ist ein Protein- 
Nukleinsauregemisch, das in der Lage ist, die in ihm enthaltenen Proteingemische und/oder 
Nukleinsauregemisch in eine Zelle einzuftihren. Dabei ist es bevorzugt, daB dabei die von den 
Nukleinsauregemischen kodierten Fusionsproteine in der Zelle zur Expression kommen und 
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somit de novo synthetisierte Fusionsproteine aus der Zelle gewonnen, bzw. auf der Zellober- 
flache prasentiert werden. Geeignete Vektoren sind beispielsweise nicht-lytische Phagen, wie 
M13-Phage, fd-Phage, Fl-Phage und lytische Phagen, wie k-Phage. 

Ein weiterer Gegenstand der vorliegenden Erfindung, ist eine Zelle, enthaltend ein erfin- 
dungsgemafies Proteingemisch, ein erfindungsgemaBes Nukleinsauregemisch und/oder einen 
erfindungsgemaBen Vektor. ErfindungsgemaBe Zellen konnen prokaryontische oder eukary- 
ontische Zellen sein. In einer bevorzugten Ausfuhrungsform der vorliegenden Erfindung, 
handelt es sich bei den erfindungsgemaBen Zellen urn prokaryontische Zellen, insbesondere 
urn Bakterien und noch bevorzugter urn E. coli (TGI, XL-1, JM83, BL21) oder B. subtilis. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist eine Bibliothek, enthaltend mindes- 
tens zwei erfindungsgemaBe Proteingemische, mindestens zwei erfindungsgemaBe Vektoren 
und/oder mindestens zwei erfindungsgemaBe Zellen, wobei die Proteine oder Proteinfiagmen- 
te der jeweiligen ersten oder jeweiligen zweiten Fusionsproteine voneinander unterschiedlich 
sind. Eine solche Bibliothek kann entweder gezielt ausgewahlte unterschiedliche bekannte 
Proteine oder Proteinfiagmente enthalten oder die Interaktionsdomane und die Proteintranslo- 
kationssequenz des ersten oder zweiten bevorzugt des zweiten Fusionsproteins konnen mit 
einer cDNA-Bibliothek fusioniert werden, wobei bei Expression dieser Nukleinsauren eine 
Vielzahl unterschiedlicher erster oder zweiter Fusionsproteine entstehen, die jeweils unter- 
schiedliche Proteine oder Proteinfiagmente enthalten. Vorzugsweise wird dabei der cDNA- 
Anteil am C-Terminus des Fusionsproteins exprimiert, urn dadurch das vorangehend geschil- 
derte Problem bei N-terminaler Fusion einer cDNA zu umgehen. In einer bevorzugten Aus- 
fuhrungsform enthalt die Bibliothek eine Vielzahl von erfindungsgemaBen Zellen, wobei jede 
Zelle ein anderes Proteingemisch herstellt, vorzugsweise auf ihrer Oberflache prasentiert. Im 
Falle, daB das Protein oder Proteinfragment und die Interaktionsdomane des ersten Proteins 
ein PhagenhUllprotein ist, erlaubt die erfindungsgemaBe Bibliothek die Prasentation einer 
Vielzahl von Proteinen oder Proteinfiagmenten, die im zweiten Fusionsprotein enthalten sind. 
Dabei ist die Prasentation nicht wie bei den im Stand der Technik bekannten Phagendisplay- 
Bibliotheken auf Proteine oder Proteinfiagmente beschrankt, die sich im Periplasma der Zelle 
zu ihrer funktionellen Form falten, sondern umfaBt auch Proteine, die nur im Zytoplasma ihre 
funktionelle Faltung erlangen konnen. 
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Die erfindungsgemafien Proteingemische, die Heterodimere oder Multimere bilden k6nnen, 
wobei die Bestandteile der Heterodimere oder Multimere in mindestens zwei unterschiedli- 
chen zellularen Kompartments ihre dreidimensionale Struktur erhalten haben, lassen sich 
nunmehr in einer Reihe von Verfahren unter anderem auch im Phagendisplay einsetzen. 

Ein weiterer Gegenstand der Erfindung ist daher ein Verfahren zum Auffinden von Substan- 
zen, die an ein Proteingemisch, emen erfindungsgemaBen Vektor oder an eine erfindungsge- 
mafie Zelle binden, enthaltend die Schritte: 

a) In-Kontaktbringen mindestens einer potentiell-bindenden Substanz mit einem erfin- 
dungsgemafien Proteingemisch, einem erfindungsgemafien Vektor oder einer erfin- 
dungsgemafien Zelle und 

b) Messen der Bindung der Substanz an das Proteingemisch, den Vektor und/oder die 
Zelle. 



Das Verfahren dient somit vorzugsweise dem Auffinden einer Substanz oder von Substanzen, 
die an ein bereits bekanntes Proteintarget binden, beispielsweise um Inhibitoren, Aktivatoren,' 
Kompetitoren oder Modulatoren des bekannten Proteintargets aufcufinden. Die potentiell bin- 
denden Substanzen deren Bindung an ein erfindungsgemafies Proteingemisch, einen erfin- 
dungsgemafien Vektor und/oder eine erfindungsgemafie Zelle gemessen werden soli, kann 
jede beliebige chemische Substanz oder jedes beliebige Substanzgemisch sein. Beispielsweise 
kann es sich hierbei um Substanzen einer Peptid-Bibliothek handeln, um Substanzen aus einer 
kombinatorischen chemischen Bibliothek, um Zellextrakte, insbesondere Pflanzenzellextrak- 
te, und um Proteine oder Proteinfragmente. 

Unter In-Kontaktbringen der potentiell bindenden Substanz(en) mit einem erfindungsgema- 
fien Proteingemisch, Vektor oder Zelle wird jede MOglichkeit der Wechselwirkung zwischen 
den beiden Komponenten verstanden, wobei sich die beiden Komponenten jeweils unabhan- 
gig voneinander in flussiger Phase, beispielsweise in LSsung oder in einer Suspension, befin- 
den kdnnen oder auch an eine feste Phase, beispielsweise in Form einer im wesentlichen pla- 
naren Oberflache oder in Form von Partikeln, Perlen oder ahnlichem, gebunden sein konnen. 
In einer bevorzugten Ausfuhrungsform ist eine Vielzahl unterschiedhcher potentiell binden- 
der Substanzen an einer festen Oberflache immobilisiert und wird mit den erfindungsgemafien 
Proteingemisch, dem erfindungsgemafien Vektor oder der erfindungsgemafien Zelle In- 
Kontakt gebracht und anschliefiend wird die Bindung der erfindungsgemaBen Substanzen an 
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den verschiedenen Positionen, an denen jeweils unterschiedliche potentiell-bindende Substan- 
zen immobilisiert sind, gemessen. 

Das Messen der Bindung des erfindungsgemaBen Proteingemiscb.es, des Vektors oder der 
Zelle, an eine potentiell bindende Substanz kann beispielsweise tiber die Messung eines mit 
dem erfindungsgemaBen Proteingemisch, mit dem erfindungsgemaBen Vektor oder der erfin- 
dungsgemafien Zelle verbundenen Markers geschehen, wobei geeignete Marker dem Fach- 
mann bekannt sind und beispielsweise Fluoreszenz- oder radioaktive Marker umfassen. In 
einer bevorzugten Ausfuhrungsform enthalt das Proteingemisch, der Vektor oder die Zelle 
zusatzlich im zweiten Fusionsprotein neben dem Protein oder Proteinfragment, dessen Wech- 
selwirkung mit den potentiell-bindenden Substanzen untersucht werden soil, ein autofluore- 
zierendes Protein, wie beispielsweise GFP oder Varianten davon. Das Messen der Bindung 
der Substanz kann jedoch auch tiber die Anderung von elektrochemischen, insbesondere Re- 
doxeigenschaften beispielsweise der immobilisierten potentiell bindenden Substanzen nach 
In-Kontaktbringen gemessen werden. Geeignete Verfahren umfassen beispielsweise poten- 
tiometrische Methoden. Weitere Verfahren zum Nachweis der Bindung zweier Molektile oder 
Molekulgemische, sind dem Fachmann bekannt und k6nnen gleichermaBen zum Messen der 
Bindung der potentiell-bindenden Substanz an das erfindungsgemaBe Proteingemisch, den 
erfindungsgemaBen Vektor oder die erfindungsgemaBe Zelle verwendet werden. 



Gegebenenfalls k6nnen vor, zwischen oder nach den Schritten des erfindungsgemaBen Ver- 
fahrens weitere Schritte eingeftihrt werden, wie beispielsweise das ein- oder mehrmalige Wa- 
schen nach dem In-Kontaktbringen, urn beispielsweise unspezifische Bindungen zwischen der 
potentiell bindenden Substanz und dem erfindungsgemaBen Proteingemisch, dem erfindungs- 
25 gemafien Vektor oder der erfindungsgemaBen Zelle zulosen. 

Als weitere Schritte nach dem Messen der Bindung der Substanz kann eine bindende Sub- 
stanz z.B. auf Grand der gemessenen Bindungsstarke ausgewahlt werden und dann direkt 
bspw. zur Inhibition des bekannten Proteintargets verwendet werden. Die bindende Substanz 
30 kann jedoch auch durch im Stand der Technik bekannte Verfahren, die auch Verfahren der 
kombinatorischen Chemie umfassen modifiziert werden. Beispielsweise durch das Anfiigen 
von Halogenseitengruppen, vorzugsweise F oder CI, durch das Anfiigen von nieder Al- 
kylgruppen, wie Methyl-, Ethyl-, n-Propyl-, iso-Propyl-, n-Butyl-, iso-Butyl- oder tert- 
Butylgruppen oder durch das Anfiigen von Amino-, Nitro-, Hydroxyl-, Amido- oder Carbon- 
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sauregruppen. Die so unterschiedlich modifizierten bindenden Substanzen kQnnen dann er- 
neut in dem erfindungsgemaBen Verfahren auf ihre Bindung getestet werden und hinsichtlich 
der gewiinschten Bindungsspezifitat und dem dadurch erzielten Effekt (beispielsweise Akti- 
vierung, Inhibierung oder Modulation der jeweiligen Aktivitat) optimiert werden. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Verfahren zum Auffinden von 
Proteinen oder Proteinfragmenten, die an eine Testsubstanz binden, enthaltend die Schritte: 

a) In-Kontaktbringen mindestens einer Testsubstanz mit einer erfindungsgemaBen Biblio- 
thekund 

b) Messen der jeweiligen Bindung der Testsubstanz an die unterschiedlichen Proteingemi- 
sche, Vektoren und/oder Zellen der erfindungsgemaBen Bibliothek. 

Bei diesem Verfahren sollen Proteine oder Proteinfragmente ausgewahlt werden, die an eine 
gegebene Testsubstanz binden. Vorzugsweise handelt es sich dabei urn die Proteine oder Pro- 
teinfragmente des zweiten Fusionsproteins, da diese mit einer groBeren Wahrscheinlichkeit 
korrekt gefaltet sind, als die Proteine oder Proteinfragmente des ersten Fusionsproteins, die 
nur dann korrekt gefaltet sind, wenn die jeweiligen Proteine auch im oxidativen Mileu des 
Periplasmas ihre native {Conformation annehmen konnen. Eine Testsubstanz im Sinne der 
vorliegenden Erfindung kann jede beliebige chemische Substanz oder ein Gemisch davon 
sein. Vorzugsweise handelt es sich dabei jedoch urn ein Protein oder Proteinfragment, insbe- 
sondere urn einen Rezeptor, einen Rezeptorliganden, einen Transkriptionsfaktor, einen Ionen- 
kanal, ein Molekul der Signaltransduktionskaskade, Struktur- und Speicherprotein, Toxin 
Oder Lichtrezeptor- und Pigmentprotein. Das Messen der jeweiligen Bindung der unterschied- 
lichen Proteingemische, Vektoren und/oder Zellen der Bibliothek an die Testsubstanz kann 
wie vorangehend beschrieben, uber markierungsabhangige oder markierungsunabhahngige 
MeBverfahren erfolgen. 

In einer bevorzugten Ausfuhrungsform des erfindungsgemaBen Verfahrens enthalt das Ver- 
fahren die weiteren Schritte: Auswahlen mindestens eines Proteingemisches, eines Vektors 
Oder einer Zelle aufgrund der gemessenen Bindung und Herstellen einer zweiten Bibliothek, 
wobei die Bibliothek durch Modifikation des im ausgewahlten Proteingemisch, im ausge- 
wahlten Vektor oder in der ausgewahlten Zelle enthaltenen Proteins oder Proteinfragments 
erzeugt wird. Der Auswahlprozefi von Proteingemischen, Vektoren oder Zellen aus der Bib- 
liothek wird vorzugsweise aufgrund der Starke der Bindung durchgefuhrt, wobei die Protein- 
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gemische, Vektoren oder Zellen bevorzugt sind, die die starkste Bindung an die jeweilige 
Testsubstanz zeigen. Ausgehend von der Aniinosauresequenz des im ausgewahlten Protein- 
gemisch, Vektor oder Zelle enthaltenen Proteins oder Proteinfragments, die durch Standard- 
verfahren bestimmt werden kann, konnen Modifikation erzeugt werden, die jeweils zu gerin- 
gen Anderungen der Aminosauresequenz ftthren und damit zu einer Vielzahl von Derivaten, 
die im Vergleich zum Ausgangsprotein bzw. Proteinfragment eine leicht veranderte dreidi- 
mensionale Struktur besitzen. Solche Modifikationen lassen sich durch im Stand der Technik 
bekannte Verfahren beispielsweise durch ZufaUsmutagenese oder auch durch gezielte Substi- 
tution einzelner Nukleinsaurecodons, der fur das Protein oder Proteinfragment kodierenden 
Nukleinsaure, erhalten. Bevorzugt sind dabei Substitution, die sogenannte .^conservative" 
Substitutionen sind. Eine konservative Substitution liegt dann vor, wenn beispielsweise ein 
fur eine basische Aminosaure kodierendes Nukleinsaurecodon durch ein anderes ftir eine ba- 
sische Aminosaure kodierendes Nukleinsaurecodon, ein fur eine saure Aminosaure kodieren- 
des Nukleinsaurecodon durch ein anderes fiir eine saure Aminosaure kodierendes Nukleinsau- 
recodon bzw. ein fur eine polare Aminosaure kodierendes Nukleinsaurecodon durch ein ande- 
res fur eine polare Aminosaure kodierendes Nukleinsaurecodon ersetzt wird. 

Die auf Grundlage der ausgewahlten Proteingemische, Vektoren oder Zellen neu erzeugten 
zweiten Bibliotheken k5nnen nunmehr in einem weiteren Schritt wiederum mit der Testsub- 
stanz in Kontakt gebracht werden, worauf in einem weiteren Schritt die jeweilige Bindung der 
Testsubstanz an die modifizierten Proteingemische, Vektoren oder Zellen der zweiten Biblio- 
thek gemessen werden kann. Gegebenenfalls kdnnen nunmehr die Schritte des Auswahlens 
mindestens eines Proteingemisches, eines Vektors oder einer Zelle aufgrund der gemessenen 
Bindung und die sich daran anschliefiend Herstellung einer dritten bzw. n-ten Bibliothek so- 
wie das Inkontaktbringen und Messen der jeweiligen Bindung der Testsubstanz an die unter- 
schiedlichen Proteingemische, Vektoren oder Zellen der dritten bzw. n-ten Bibliothek, ein bis 
n-mal wiederholt werden bis ein Proteingemisch, ein Vektor oder eine Zelle ausgewahlt wor- 
den ist, das, der bzw. die die gewUnschte Bindung zeigt. 

Das zuvor geschilderte Verfahren wird auch als gerichtete Evolution bezeichnet, da in einer 
Vielzahl von Schritten die aus Modifikation und Selektion bestehen, Proteine oder Protein- 
fragmente „evolutionar" hinsichtlich einer bestimmten Eigenschaft, insbesondere ihrer Bin- 
dungseigenschaft weiterentwickelt werden. 
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Die durch das obige Verfahren aufgefundenen oder zusatzlich hinsichtlich einer bestimmten 
Eigenschaft optimierten Proteine oder Proteinfragmente konnen, wenn sie beispielsweise auf 
die Aktivierung oder Repression eines bestimmten zellularen Signalwegs bin optimiert wor- 
den sind, als Wirkstoff in einem Medikament eingesetzt werden. Dasselbe gilt fur die binden- 
den Substanzen, die in dem Verfahren zum Aufifinden von potentiell bindenden Substanzen 
identifiziert worden sind. Daher umfassen die erfindungsgemaBen Verfahren in einer bevor- 
zugten Ausfuhrungsform den weiteren Schritt, dafi die ausgewahlte bindende Substanz oder 
das in dem ausgewahlten Proteingemisch, in dem ausgewahlten Vektor oder in der ausge- 
wahlten Zelle enthaltene Protein oder Proteinfragment oder eine Variante davon mit einem 
pharmazeutisch akzeptablem Trager und/oder Hilfsstoff gemischt wird. 

Eine „Variante" des Proteins oder Proteinfragments beinhaltet Modifikation des N- oder C- 
Terminus oder Modifikation von Aminosaureseitenketten, die beispielsweise die Stability 
Loslichkeit oder Biokompatibilitat des Proteins oder Proteinfragments erhohen. UmfaBt sind 
jedoch auch Fusionsproteine mit den erfindungsgemaB identifizierten Proteinen oder Protein- 
fragmenten, die als weitere Komponenten beispielsweise autofluoreszente Marker, wie bei- 
spielsweise GFP oder Zytostatika wie beispielsweise Choleratoxin enthalten k6nnen. 

Pharmazeutisch akzeptable Trager und/oder Hilfsstoffe umfassen Substanzen, die die binden- 
de Substanz bzw. das Protein oder Proteinfragment oder seine Varianten stabilisieren, deren 
pharmazeutische Vertraglichkeit erhohen oder die fur die jeweilige Applikationsform, wie 
beispielsweise Tablette, Pilaster oder Infusionslosung, erforderlich sind, wie beispielsweise 
Konservierungsmittel, Puffer, Salz oder Proteaseinhibitoren. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Kit zur Herstellung eines Nuk- 
leinsauregemisches nach Anspruch 10 enthaltend: 

a) mindestens eine erste Nukleinsaure enthaltend mindestens eine Restriktionsschnittstelle 
5' und/oder 3' von einer Nukleinsaure kodierend fur ein erstes Fusionsprotein enthal- 
tend: 

i) eine Interaktionsdomane und 

ii) eine Proteintranslokationssequenz, die bewirkt, dafi das erste Fusionsprotein bei 
Expression in einem Bakterium in einem im wesentlichen gefalteten Zustand durch 
die zytoplasmatische Membran transloziert wird. 
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Dieses Kit erlaubt die Insertion einer ausgewahlten Nukleinsauresequenz 5' oder 3' von der 
Nukleinsaure, die ftir eine Interaktionsdomane und eine Proteintranslokationssequenz kodiert, 
so daB im Ergebnis von der resultierenden Nukleinsaure ein Fusionsprotein kodiert wird, das 
am C-Terminus und/oder am N-Terminus ein durch die jeweils eingefuhrte Nukleinsaurese- 
quenz kodiertes Protein oder Proteinfragment enthalt Vorzugsweise handelt es sich bei der 
eingefuhrten DNA urn eine cDNA-Bibliothek, wobei diese besonders bevorzugt unter Ver- 
wendung der S'-RestriktionsschnittsteUe in die Nukleinsaure eingefuhrt wird. In einer bevor- 
zugten AusfUhrungsform enthalt das Kit den Leuzin-Zipper aus dem cFos-Protein und in einer 
weiteren Bevorzugten Ausfuhrungsform die Tat-abhangige Proteintranslokationssequenz To- 



In einer weiteren Ausfuhrungsform des erfindungsgemafien Kits enthalt das Kit des weiteren 
mindestens eine zweite Nukleinsaure enthaltend mindestens eine Restriktionsschnittstelle 5' 
und/oder 3' von einer Nukleinsaure kodierend flir ein zweites Fusionsprotein enthaltend: 

i) eine Interaktionsdomane und 

ii) eine Proteintranslokationssequenz, die bewirkt, daB das zweite Fusionsprotein bei 
Expression in einem Bakterium in einem im wesentlichen ungefalteten Zustand 
durch die zytoplasmatische Membran transloziert wird, wobei die Interaktionsdo- 
mane des ersteh Fusionsproteins an die des zweiten Fusionsproteins binden kann. 

Diese Nukleinsaure erlaubt die Insertion 5' oder 3' von der fur eine Interaktionsdomane und 
eine Proteintranslokationssequenz kodierenden Nukleinsaure, so daB im Ergebnis von der 
resultierenden Nukleinsaure ein Fusionsprotein kodiert wird, das am N- oder C-Terminus ein 
von der insertierten Nukleinsaure kodiertes Protein oder Proteinfragment umfaBt. Beispiels- 
weise konnen Nukleinsauren, die fur Phagenhullproteine kodieren in die Nukleinsaure inser- 
tiert werden, wobei diese vorzugsweise in die 3 '-Restriktionsschnittstelle eingefuhrt werden. 

Es hat sich gezeigt, daB wenn in die zweite Nukleinsaure Nukleinsauren eingefuhrt werden, 
die fur Phagenhullproteine kodieren, daB die resultierenden Fusionsproteine bei starker Ex- 
pression von beispielsweise dem glllp-Fusionsprotein zu eine hohen Toxizitat fur E. coli- 
Zellen ftlhren. Aus diesem Grund wird bei klassischen Phagendisplaysystemen ein Amber- 
Codon 5' von dem gHI-Protein eingefiigt. In Supressorstammen (z.B. XL-1 Blue) wird da- 
durch die Expression des glHp-Fusionsproteins urn ca. 90% reduziert. DarUber hinaus ermog- 
licht das Amber-Codon (das in Nicht-Suppressorstammen als STOP-Codon gelesen wird) 
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sehr einfach die lfisliche Expression des zuvor mit dem Phagenprotein fasionierten und auf 
dem Phagen prasentierten Proteins, indem das Phagemid in einen Nicht-Suppressorstamm 
(z.B. BL21) eingebracht und dort die Expression durchgefuhrt wird. Daher enthalt die erste 
und/oder die zweite Nukleinsaure in einer bevorzugten Ausfuhrungsform entweder 5 oder 3' 
ein Amber-Codon. Vorzugsweise ist das Amber-Codon in der ersten Nukleinsaure 5' ange- 
ordnet und in der zweiten Nukleinsaure 3' angeordnet. Dadurch lfifit sich in einem geeigneten 
bakteriellen Wirt erreichen, daB ausschlieBlich das in der ersten Nukleinsaure 5'eingeftigte 
Protein oder Proteinfragment exprimiert wird und gleichzeitig der toxische Effekt des in der 
zweiten Nukleinsaure 3' eingefiigten glllp verhindert wird. 

In einer weiteren bevorzugten Ausfuhrungsform des erfindungsgemaBen Kits ist die Interakti- 
onsdomane des zweiten Fusionsproteins die Leuzin-Zipperdomane des cJun-Proteins. In einer 
weiteren bevorzugten Ausfuhrungsform enthalt die Nukleinsaure eine Nukleinsaure, die fur 
eine Sec-abhangige Proteintranslokationssequenz insbesondere das PelB-Fuhrungspeptid ko- 
diert. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist die Verwendung einer Zelle zur Her- 
stellung eines erfindungsgemaBen Proteingemisches sowie die Verwendung eines erfindungs- 
gemaBen Proteingemisches, eines erfindungsgemaBen Vektors oder einer erfindungsgemaBen 
Zelle zur Herstellung einer erfindungsgemaBen Bibliothek. 

Ein bevorzugtes Anwendungsgebiete der erfindungsgemaBen Proteingemische, erfindungs- 
gemaBen Phagen, der erfindungsgemaBen Zellen, insbesondere der erfindungsgemaBen Bib- 
liotheken, enthaltend vorgenannte Proteingemische, Phagen und Zellen sowie der erfindungs- 
gemaBen Kits, ist die Presentation von Proteinen auf filamentosen Phagen. Ein besonderer 
Schwerpunkt liegt dabei auf Proteinen, die aufgrund ihrer Inkompatibilitat mit dem Sec- 
Transportweg nicht mit Hilfe der klassischen Phagendisplay-Technologie prasentiert werden 
konnen. Als besonders bevorzugte Anwendungsbereiche ergeben sich daher die Prasentation 
und Selektion von cDNA-Expressionsbibliotheken und die Prasentation und Selektion von 
DNA-Bibliotheken zur gerichteten Evolution von Proteinen, auch „protein engineering" ge- 
nannt. 

Eine weitere bevorzugte Verwendung liegt in der Herstellung von Proteinkonjugaten. Dabei 
ist die Verwendung dann besonders bevorzugt, wenn das Protein oder Proteinfragment des 
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ersten Fusionsproteins und das Protein oder Proteinfragment des zweiten Fusionsproteins je- 
weils unterscbiedliche Anforderungen hinsichtlich der zur korrekten Faltung erforderlichen 
zellularen Umgebung haben. So erlaubt es die vorliegende Erfmdung Antikorper direkt mit 
Markerproteinen gentechnisch zu fusionieren, die bei Produktion in Bakterien und Transport 
tiber den Sec-abhangigen Transportweg nicht korrekt gefaltet wttrden und daher bei Anwen- 
dung von Standardverfahren nicht als Markerprotein zur Markierung des Antikorper verwen- 
det werden konnen. Markerproteine-Antikorperfusion, deren funktionelle Expression erst 
durch die vorliegende Erfindung mfiglich geworden ist, umfassen beispielsweise Fusionen aus 
autofloreszierenden Proteine, wie GFP und schweren Immunoglobulinketten, leichten Immu- 
noglobulinketten oder „single-chain-antibodies". 

Die folgenden Abbildungen und Beispiele dienen lediglich der Illustration der Erfindung und 
sind nicht als Beschrankung derselben auf die konkret in den Beispielen angegebenen Aus- 
fiihrungsformen zu verstehen. Alle im Text enthaltenen Zitate werden hierdurch in ihrem ge- 
samten Umfang durch Verweis aufgenommen. 

Abbildungen 

Abb. 1 Konsensussequenzen Tat-abhangiger, Sec-abhangiger, SRP-abhMngiger oder 

YidC-abhangiger Signalsequenzen, wobei X eine beliebige Aminosaure und # 
eine hydrophobe Aminosaure prasentieren. 

Abb. 2 Tat-abhangiges TorA-Signalpeptid, wobei X eine beliebige Aminosaure und # 

eine hydrophobe Aminosaure prasentieren 

Abb. 3 Prinzip des TLF-Systems, wobei CT die Domane des pHl, pelB die Sec- 

Signalsequenz, TSS die Tat-Signalsequenz und POI das prasentierte Protein 
bedeuten. 

Abb. 4 Restriktionskarte des Plasmids pCD4/GFP24, dessen NukleinsSuresequenz als 

SEQ ID NR: 1 im Anhang wiedergegeben ist. 



Abb. 5 



Restriktionskarte des Plasmids pCAl/GFP24, dessen Nukleinsauresequenz i: 
SEQ ID NR: 2 wiedergegeben ist. 
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Abb. 6 Restriktionskarte des Plasmids pCNl/GFP24, dessen Nukleinsauresequenz in 

SEQ ID NR.: 3 wiedergegeben ist. 

5 Abb. 7 Kompetitiver Phagen-ELISA, wobei weifle Balken die Ergebnisse mit GFP24- 

prasentierende Phagen zeigen. GFP24-Phagen wurden mit Hilfe von XL-1 
Blue Zelle hergestellt, die das Plasmid pCD4/GFP24 tragen. Graue Balken pra- 
sentieren die Ergebnisse, die mit p-Lactamase-tragenden Phagen erzielt wur- 
den. P-Lactamase-prasentierende Phagen wurden in XL-1 Blue Zelle herge- 
1 0 stellt, die das Plasmid pCD4/BL A trugen. 

Abb. 8 Enzymatischer Assay, der Prasentation von P-Lactamase auf Bakteriophage, 

wobei weifien Kreise die Ergebnisse mit GFP24-tragende Phagen zeigen. 
GFP24-Phagen wurden mit Hilfe von XL-1 Blue Zelle hergestellt wurden, die 
das Plasmid pCD4/GFP24 tragen. Schwarze Vierecke prasentieren die Ergeb- 
nisse die mit p-Lactamase-tragenden Phagen erzielt wurden. p-Lactamase- 
prasentierende Phagen wurden in XL-1 Blue Zelle hergestellt, die das Plasmid 
pCD4/BLA trugen. Gezeigt wird die Absorption bei 486 nm in Abhangigkeit 
von der Zeit. 

20 



15 



Beispiele 

Beispiel 1: Verwendete Vektoren 

25 

PCD4/GFP24 ist ein Cysteindisplay-Phagemid, das auf dem pGP-Vektor (Paschke M., et al.: 
(2001) Biotechniques 30: 720-725) beruht. 



30 



PCA1/GFP24 ist ein Cysteindisplay-Phagemid, das auf pGP-FlOO basiert. Es kann fur die 
tet°- p -kontrollierte Expression von Protein als Fusion von cFos-Leuzin-Zipper verwendet wer- 
den. Die Translokation des cFos-Fusionsproteins im periplasmatischen Raum wird durch die 
TorA-Fuhrungspeptidsequenz (Tat-abhangige Translokationsweg) vermittelt. Das tet°- p - 
kontrollierte Transkript enthalt ein zweites Cistron, von dem das c-jun::G3Ps-Fusionsprotein 
exprimiert wird. Das c-Jun::G3Ps wird fiber den Sec-abhangigen Translokationsweg in dem 
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periplasmatischen Raum gesteuert. Kovalente Komplexe zwischen dem cFos-Fusionsprotein 
und dem cJun::G3PS-Fusionsprotein werden im periplasmatischen Raum aufgrund der Dime- 
risierung von cJun und cFos und anschliefiender Ausbildung von Cysteinbindungen zwischen 
den Proteinen hergestellt. Das Phagemid enthalt eine GFP24-Kassette, flankiert von Sfil- 
Restriktionsstellen an den Positionen 148 und 910 und ist zwischen dem TorA- 
Fuhrungspeptid und cFos angeordnet Diese Kassette muB durch das zu prasentierende Prote- 
in ersetzt werden. 



PCA1/GFP24 ist ein von pCD4 abgeleitetes Cysteindisplay-Phagemid, das auf dem pGP- 
Vektor basiert. pCD4/GFP24 ist ein Cysteindisplay-Phagnid, das auf dem pGP-Vektor 
(Paschke M., et al.: (2001) Biotechniques 30: 720-725) beruht. Es kann fur die tet°- p - 
kontrollierte Expression von Proteinen als Fusion mit dem cFos-Leucinzipper verwendet wer- 
den. Die Translokation des cFos-Fusionsproteins in den periplasmatischen Raum wird durch 
das TorA-Fuhrungspeptid (Tat-Transportweg) vermittelt Das tet 0 -P-kontrollierte Transkript 
enthalt ein zweites Cistron, von dem das c-jun::G3Pss Fusionsprotein exprimiert wird (G3Pss 
umfaBt Aminosauren 252 bis 406 des reifen gill-Proteins des fd-Phagen). Das c-jun:G3Pss 
wird durch einen Sec-abhangigen Transportweg (pelB-Fiihrungspeptid) in dem periplasmati- 
schen Raum gelenkt. Kovalente Komplexe von cFos-Fusionsprotein und c-jun::G3Pss werden 
aufgrund der Dimerisierung zwischen cJun und cFos im periplasmatischen Raum und die an- 
schliefiende Ausbildung von Cysteinbindung zwischen den Proteinen gebildet (Crameri, R. 
und Suter M. (1993), siehe oben). Der Phagendisplay der Proteine, die mit cFos fusioniert 
sind, kann durch sogenannten Helferphargenrescue erreicht werden. Im Gegensatz zu pGP 
ubertrSgt das Phagemid pCD4-GFP24 Chloramphenicolresistenz. Das Resistenzgen (CAT) 
und der tet-Repressor (TetR) werden unter Kontrolle des P-Lactamasepromotors von einer 
bicistronischen Kassette kontrolliert. Das Transkript wird in einem VPhagenterminator termi- 
niert. Die Tat-TetR-Kassette ist in umgekehrter Orientierung zu der cFos- und cJun- 
Fusionskassette. Eine GFP24-Kassette, flankiert an der Position 148 und 910 von Sfil- 
Restriktionsstellen ist zwischen dem TorA-Fuhrungspeptid und cFos angeordnet. Diese Kas- 
sette wird durch das zu prasentierenden Protein ersetzt. 

pCD4/Bla ist ein von pCD4/GFP24 abgeleitetes Cysteindisplay-Phagemid, bei dem mittels 
Restriktion mit Sfil das GFP24 Fragment durch die Sequenz der reifen TEM1 p-Lactamase 
ersetzt wurde. Die eingefugte Lactamaseklonierungskasette mit 5' und 3<-terminalen Sfil- 
Restriktionsstellen ist in SEQ ID NR: 4 wiedergegeben. 
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Beispiel 2: Herstellun p VO n Bakteriop hapen 

Mit dem entsprechenden Phagemid transformierte XLI-Blue-Zellen wurden in 2 TY- 
Selektionsmedium bei 30°C bis zu einem OD 600m „ von 0,5 kultiviert und dann mit dem Hel- 
ferphagen VCSM13 mit einem Moi - 10-20 gemischt. Die infizierte Kultur wurde fur 30 Mi- 
nuten bei 37°C kultiviert und anschlieBend mit Kanamizin in einer Endkonzentration von 60 
ug/ml versetzt. Die Kultur wurde fur 10 Minuten bei 25°C kultiviert. Durch Zentrifugation 
(4000 x g, 4°C, 5 Minuten) wurden die Zellen geerntet und anschlieBend in 2 TY- 
Selektionsmedium enthaltend 60 ug/1 Kanamizin und 0,5 ug/ml Tetracyclin resuspendiert. 
Diese Kultur wurde fur 5 h bei 25°C kultiviert. AnschlieBend folgte die Phagenpraparation 
aus dem Zellkulturuberstand wie folgt: Jeweils 40-50 ml Zellen und Zelltrummer wurden 
durch Zentrifugation (4°C, 10.000 rpm in einem A8-24-Rotor fur 15 Minuten) vom phagen- 
haltigen Zellkulturuberstand getrennt. Der Oberstand wurde durch einen 0,45 urn Filter filt- 
riert und mit K Volumen PEG-NaCl-Losung (20% w/v PEG 8000, 50% w/v NaCl) gemischt 
und fiber Nacht oder fur mindestens eine Stunde auf Eis inkubiert. Die Mischung wurde dann 
bei 4°C fur 15 min bei 15.000 rpm in einem A8.24-Rotor zentrifugiert. Der Niederschlag 
wurde in 2,5 ml eiskaltem PBS resuspendiert und auf 2 ml Plastikrohrchen verteilt. Dann 
wurde der Oberstand mit Va Volumen PEG-NaCl-L6sung gemischt und fur mindestens eine 
weitere Stunde auf Eis inkubiert. AnschlieBend wurde der ttberstand bei 4°C und 14.000 rpm 
fur 15 Minuten zentrifugiert. Der Phagenniederschlag wurde in 0,5-1 ml PBS gelost Gegebe- 
nenfalls wurde die Phagenlosung durch einen 0,45 urn-Filter filtriert und anschlieBend bei 
4°C gelagert. Bei langerer Lagerung wurde die PhagenlQsung mit 1 Volumen Glycerol ver- 
setzt und bei -70°C gelagert. 

Der Phagentiter wurde durch Standardverfahren unter Verwendung einer Verdiinnungsreihe 
bestimmt. Der Titer lag iiblicherweise zwischen 10 12 und 10 13 cfu/ml. 

Beispiel 3: Prasentation von funktionellem GFP24 auf Phagen 

GFP24 ist eine zirkularpermutierte Variante des griin fluoreszierenden Proteins, die zusStzlich 
ein Epitop des P24-Proteins aus HTV enthalt (Hohne, W.E. et al. (1993) Mol Immunol 
30:1213-21). GFP24 wird durch den anti-P24-Antikorper CB4-1 (Dr. Scholz, Institut fur Bio- 
chemie, (Universitatsklinikum Charite)) mit hoher Affinitat gebunden. GFP24 kann wie auch 
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15 



GFP selbst nicht ttber den Sec-Transportweg exportiert werden. Ein funktionelles GFP24 Pro- 
tein sollte daher bei Expression des oben geschriebenen pCD4/GFP24-Plasmids nur dann zur 
Prasentation eines funktionsfahigen GFP24 fuhren, wenn dieser Teil des Proteins nicht durch 
einen Sec-abhangi gen Transportweg, sondern durch einen Tat-abhangigen Transportweg in 
das Periplasma transportiert worden ist. Urn GFP24 auf filamentSsen Phagen nachzuweisen, 
wurde ein Phagen-ELISA wie folgt durchgefuhrt. Mikrotiterplatten wurden mit 10 urn/ml 
anit-P24Antik6rper-C4-l beschichtet, dreimal mit PBS/Tween 0,1% gewaschen und mit 200 
ul pro Vertiefung Genosys-Blockierungsreagenz (Sigma-Genosys Ltd, Cambridge, UK)) fin- 
em bis zwei Stunden bei Raumtemperatur unter Schtttteln inkubiert. Anschliefiend wurde die 
Mikrotiterplatte dreimal mit PBS/Tween 20 0,1% gewaschen. Anschliefiend wurden 50 ul pro 
Vertiefung GFP24 prasentierende Phagen mit und ohne P24-Peptid in die Mikrotiterplatte 
gegeben und anschliefiend die Gegenwart des Phagen in der Mikrotiterplatte mit einem Meer- 
rettichperoxidase gekoppelten anti-Phagen-Antikfirper (Seramun Diagnostica GmbH, Dol- 
genbrodt, Germany)) nachgewiesen. Die Signalstarke entsprach dabei dem an CB4-1 gebun- 
denen Phagen. pCD4/GFP24 Phagen wurden dabei vollstandig von CB4-1 durch das P24- 
Peptid verdrangt, wahrend p- Lactamase prasentierende Phagen (pCD4/BLA), die als Kon- 
trolle verwendet wurden, nicht an CB4-1 gebunden wurden. Dariiber hinaus konnte keine 
unspezifische Bindung an anderer AntikSrper oder das Blockierungsreagenz beobachtet wer- 
den (s. Abb. 7). 



Beispiel 4: Prasentation von TEM-l-R- T. a r.t a m ase auf filamentSsen Pharan 

TEM-l-p-Lactamase ist ein periplasmatischen Protein, das durch die Hydrolyse des Lactam- 
rings des Antibiotikums Ampicillin Resistenz gegen Ampicillin vermitteln kann. TEM-P- 
Lactamase wird normalerweise mittels des Sec-abhangigen Transportsystems ins Periplasma 
exportiert. Zum Nachweis, dafi TEM-l-p- Lactamase auch durch den Tat-abhangigen Trans- 
portweg exportiert werden kann, wurde die Sec-Signalsquenze entfernt und durch die TorA- 
Sequenz ersetzt. Die erfolgreiche Prasentation von TEM-l-P- Lactamase wurde mit dem 
nachfolgend beschriebenen Enzymessay nachgewiesen, dessen Ergebnis in Abb. 8 dargestellt 
ist. 800 ul PBS pH 7,4 wurden mit 100 ul Nitrocefin-StammlSsung (500 ug/ml) gemischt und 
auf 25°C temperiert. 100 jil Phagenlosung wurden hinzugegeben. Die Extinktsionsanderung 
bei 486 nm wurde photometrisch ttber 10 min. beobachtet. Die Absorptionsanderung bei 486 
nm entspricht dabei der P-Lactamaseaktivitat der Phagen. Wahrend pCD4/GFP24-Phagen 
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keine p-Lactamaseaktivitat zeigten, war bei pCD4/BLA eine starke p-Lactamaseaktivitat zu 
beobachten. 

Die Nitrocefinstammlosung wurde folgendermaBen hergestellt: 1 mg Nitrocefin wurd in 100 
5 ill DMSO gel6st. Diese LSsung wurde dann mit 1,9 ml PBS pH 7,4 gemischt. Die LQsung 
wurde fur maximal zwei Wochen bei -20°C gelagert. 
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Anpriiche 

Proteingemisch enthaltend: 

a) mindestens ein erstes Fusionsprotein enthaltend: 

i) ein Protein oder Proteinfragment, 

ii) eine Interaktionsdomane und 

iii) eine Proteintranslokationssequenz, die bewirkt, daB das Fusionsprotein bei 
Expression in einem Bakterium in einem im wesentlichen ungefalteten Zustand 
durch die zytoplasmatische Membran transloziert wird, 

und 

b) mindestens ein zweites Fusionsprotein enthaltend: 

i) ein Protein oder Proteinfiragment, 

ii) eine Interaktionsdomane und 

iii) eine Proteintranslokationssequenz, die bewirkt, daB das Fusionsprotein bei 
Expression in einem Bakterium in einem im wesentlichen gefalteten Zustand 
durch die zytoplasmatische Membran transloziert wird, 

wobei die Interaktionsdomane des ersten Fusionsproteins an die des zweiten 
Fusionsproteins binden kann. 

Proteingemisch nach Anspruch 1, wobei das Protein oder Proteinfragment des ersten 
Fusionsproteins eine schwere Immunoglobulinkette, eine leichte Immunoglobulinkette, 
ein single-chain Antikorper, ein Diabody, ein Rezeptor, ein Rezeptorligand, ein 
Integrin, ein Intimin, ein Kohlenhydrat-bindendes Protein, ein Albumin-bindendes 
Protein oder Protein A ist. 
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Proteingemisch nach Anspruch 1 oder 2, wobei das Protein oder Proteinfragment des 
zweiten Fusionsproteins ein autofluoreszierendes Protein, insbesondere GFP oder eine 
Variante davon, ein Enzym, ein Cofaktor-abhangiges Protein, ein Protein, das von einer 
aus einer cDNA-Bibliothek stammenden cDNA kodiert wird, oder ein synthetisches 
Protein ist. 

Proteingemisch nach Anspruch 1, wobei das Protein oder Proteinfragment des ersten 
Fusionsproteins und die Proteintranslokationssequenz ein Phagenhullprotein, ein 
periplasmatisches Markerenzym, ein Intimin, ein Protein der aufieren 
Bakterienmembran oder ein periplasmatisches Rezeptorprotein ist. 

Proteingemisch nach Anspruch 4, wobei das Phagenhullprotein ausgewahlt ist aus den 
M13-Phagenhullproteinen pill, pVI, pVn, pVIII und pIX. 

Proteingemisch nach einem der Anspriiche 1 bis 5, wobei die Interaktionsdomanen des 
ersten und zweiten Fusionsproteins jeweils eine Leuzin-Zipper-Domane und eine 
Leuzin-Zipper-Domane, eine Helix-Loop-Helix-Domane und eine Helix-Loop-Helix- 
Domane, ein Calmodulin und ein Calmodulin-bindendes Peptid oder ein Peptid-Dimer- 
Paar natiirlichen oder synthetischen Ursprungs sind. 

Proteingemisch nach einem der Anspriiche 1 bis 6, wobei die Proteintranslokations- 
sequenz des ersten Fusionsproteins eine Sec-abhangige, SRP-abhangige, YidC- 
abhangige Sequenz oder eine Transportweg-unabhangige Sequenz, die in die Membran 
integriert wird, ist. 

Proteingemisch nach einem der Anspriiche 1 bis 7, wobei die Proteintranslokations- 
sequenz des zweiten Fusionsproteins eine Tat-abhangige oder Thylakoid-ApH- 
abhangige Sequenz ist. 

Proteingemisch nach einem der Anspriiche 1 bis 8, wobei das erste Fusionsprotein an 
das zweite Fusionsprotein kovalent oder nicht-kovalent gebunden ist. 



Nukleinsauregemisch kodierend fur ein Proteingemisch nach einem der Anspriiche 1 bis 
8. 
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1 1 . NukleinsSuregemisch nach Anspruch 1 0, wobei mindestens zwei Nukleinsauren, die fur 
unterschiedliche Fusionsproteine kodieren, kovalent miteinander verbunden sind. 

12. Vektor enthaltend ein Proteingemisch nach einem der Anspriiche 1 bis 9 und/oder ein 
NukleinsSuregemisch nach einem der Anspriiche 10 oder 11. 

13. Zelle enthaltend ein Proteingemisch nach einem der Anspriiche 1 bis 9, ein 
Nukleinsauregemisch nach einem der Anspriiche 10 oder 11 und/oder einen Vektor 
nach Anspruch 12. 



14. Bibliothek enthaltend mindestens zwei Proteingemische nach einem der Anspriiche 1 
bis 9, mindestens zwei Vektoren nach Anspruch 12 und/oder mindestens zwei Zellen 
nach Anspruch 13, wobei die Proteine oder Proteinfragmente der jeweiligen ersten oder 
jeweiligen zweiten Fusionsproteine voneinander unterschiedlich sind. 

15. Verfahren zum Auffinden von Substanzen, die an ein Proteingemisch nach einem der 
Anspriiche 1 bis 9, an einen Vektor nach Anspruch 12 oder an eine Zelle nach Anspruch 
13 binden, enthaltend die Schritte: 



a) In-Kontaktbringen mindestens einer potentiell bindenden Substanz mit einem 
Proteingemisch nach einem der Anspriiche 1 bis 9, einem Vektor nach Anspruch 12 
und/oder einer Zelle nach Anspruch 13 und 

b) Messen der Bindung der potentiell bindenden Substanz an das Proteingemisch, den 
Vektor und/oder die Zelle. 



Verfahren zum Auffinden von Proteinen oder Proteinfragmenten, die an eine 
Testsubstanz binden, enthaltend die Schritte: 

a) In-Kontaktbringen mindestens einer Testsubstanz mit einer Bibliothek nach 
Anspruch 14 und 
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b) Messen der jeweiligen Bindung der Testsubstanz an die unterscmedlichen 
Proteingemische, Vektoren und/oder Zellen der BibUothek. 

1 7. Verfahren nach Anspruch 1 6 enthaltend die weiteren Schritte: 

a) Auswahlen mindestens eines Proteingemisches, eines Vektors oder einer Zelle auf 
Grund der gemessenen Bindung und 

b) Herstellen einer zweiten Bibliothek, wobei die Bibliothek durch Modifikation des 
im ausgewahlten Proteingemisch, im ausgewahlten Vektor oder in der 
ausgewahlten Zelle enthaltenden Proteins oder Proteinfragments erzeugt wird. 

1 8. Verfahren nach Anspruch 1 6 enthaltend die weiteren Schritte: 

a) Auswahlen mindestens eines Proteingemisches, eines Vektors oder einer Zelle auf 
Grund der gemessenen Bindung, 

b) Herstellen einer zweiten Bibliothek, wobei die Bibliothek durch Modifikation des 
im ausgewahlten Proteingemisch, im ausgewahlten Vektor oder in der 
ausgewahlten Zelle enthaltenden Proteins oder Proteinfragments erzeugt wird, 

c) In-Kontaktbringen mindestens einer Testsubstanz mit der zweiten Bibliothek, 

d) Messen der jeweiligen Bindung der Testsubstanz an die unterschiedlichen 
Proteingemische, Vektoren oder Zellen der zweiten Bibliothek und 



em 



e) gegebenenfalls Wiederholen der Schritte a) bis d) bis ein Proteingemisch, 
Vektor oder eine Zelle ausgewahlt wird, das, der bzw. die die gewunschte Bindung 
zeigt. 

19. Verfahren nach einem der Anspruche 15 bis 18, wobei in einem weiteren Schritt die 
bindende Substanz oder das in dem ausgewahlten Proteingemisch, in dem ausgewahlten 
Vektor oder in der ausgewahlten Zelle enthaltende Protein oder Proteinfragment oder 
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eine Variante davon mit einem pharmazeutisch akzeptablen TrSger und/oder Hilfsstoff 
gemischt wird. 



Kit zur Herstellung eines Nukleinsauregemisches nach Anspruch 10 enthaltend: 

a) mindestens eine erste Nukleinsaure enthaltend mindestens eine 
Restriktionsschnittstelle 5' und/oder 3' von einer Nukleinsaure kodierend fur ein 
erstes Fusionsprotein enthaltend: 

i) eine Interaktionsdomane und 

ii) eine Proteintranslokationssequenz, die bewirkt, dafi das erste Fusionsprotein 
bei Expression in einem Bakterium in einem im wesentlichen gefalteten 
Zustand durch die zytoplasmatische Membran transloziert wird. 



Kit nach Anspruch 20, desweiteren enthaltend: 



a) mindestens eine zweite Nukleinsaure enthaltend mindestens eine 
Restriktionsschnittstelle 5 s und/oder 3' von einer Nukleinsaure kodierend fur ein 
zweites Fusionsprotein enthaltend: 

i) eine Interaktionsdomane und 

ii) eine Proteintranslokationssequenz, die bewirkt, daB das zweite Fusionsprotein 
bei Expression in einem Bakterium in einem im wesentlichen ungefalteten 
Zustand durch die zytoplasmatische Membran transloziert wird, 

wobei die Interaktionsdomane des ersten Fusionsproteins an die des zweiten 
Fusionsproteins binden kann. 

Verwendung einer Zelle nach Anspruch 13 zur Herstellung eines Proteingemisches 
nach einem der Anspruche 1-9. 



Verwendung eines Proteingemisches nach einem der Anspruche 1 bis 9, eines Vektors 
nach Anspruch 12 und/oder einer Zelle nach Anspruch 13 zur Herstellung einer 
Bibliothek nach Anspruch 14. 
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SEQUENZPROTOKOLL 

<110> Universitatsklinikum Charity 

<120> ?erwendung ndeStenS ^^P^teine sowie ihre Herstellung und 

<130> U30038 

<150> DE 10256669.0 
<151> 2002-12-04 

<160> 4 

<170> Word 98, Windows 

<210> 1 

<211> 4765 

<212> DNA 

<213> kUnstliche Sequenz 
<220> 

<221> pCD4/GFP24 Klonierungs- und Expressions vektor 



<400> 



60 
120 
180 
240 
300 



^f?f!? aga a ^agaaaa ataatgaaca ataacgatct ctttcaggca tcacgtcggc 
gttttctggc acaactcggc ggcttaaccg tcgccgggat gctggggccg tcat?gt?aa 
alttltllll ********** gcccagocgg ccatggcggg atccgtLaa ctagcagacc 
attatcaaca aaatactcca attggcgatg gccctgtcct tttaccagac aaccatLcc 

********** tcgaaagatc ooaacgaaaa gcgtgaccac a?ggtcc?tc ,00 

ii?"££ tg J aac tg°tgct gggatttccg gtggtggtgg tgctaccccg caggacctga 360 

ttc??ar?oa llt ^l ********** gagaagaaot tttcactgga gttJgtcccaa 420 

********** gatgttaatg ggcacaaatt ttctgtcagt ggagagggtg 480 

aaggtgatgc aacatacgga aaacttaccc ttaaatttat ttgcactact ggaaaactac 540 

ttlaaaTc-l ********** ^cactactt tctcttatgg tgttoaatgo S£"c£? 600 

atccggatca tatgaaacgg catgactttt tcaagagtgc catgcccgaa ggttatqtac 660 

aggaacgcac tatatctttc aaagatgaog ggaactacaa gacgcgtgot glagtcaagt 120 

ttgaaggtga tacccttgtt aatcgtatcg agttaaaagg tattgitttt aaagaaga?g ill 

lllltlT cggacacaaa ctcgagtaoa actataactc acacaatgta tacatclcgg 840 

Tall^ll ***^^ atcaaagota acttcaaaat tcgccacaac attgaaga?? 900 

ggccgoagaa caaaaactca totcagaaga gaatctgtat ttccagggcg 960 
atgcttgcgg tggcaccgac accctgcaag ctgaaaccga ccagctggaa gacqagaaat 1020 
ccgctctgca gactgaaatc gotaaoctgo tgaaagagaa agagaalctg J«??S?Jc llll 

SEES ££££ SSSS So™* 

SEES tg h tg 'll ££££ ^KS- - a " "a C a a a C cc^gc llel 
gcaSaactt lllltllttt ********** "tgctgogt gaacaggttg otoagctgaa H20 
t^flll**: at 5 aac °acg gcggttgtgg tggcggttcc ctagcgggct ccggttccgg 1380 
taaSacaS I?*™**** ********** taataagggg gctatgaccg aaaatgccgl 1440 
taclaltltl S f 9 a ^^aaagg caaacttgat totgtcgcta ctgat?acgg 1500 
SSSttt lltaltltt ttggtgacgt ttccggcctt gotaatggta atggtgctac 1560 
t??aa?aaat" lltlltlZt, a " C ^ aaat wcteaagto ggtgacggtg ataattcaoc 1620 
ttataS^ ** tttcc< 3tc aatatttacc ttctttgcct cagtcggttg aatgtcgccc 1680 
!^tcttt ggcgctggta aaccatatga attttctatt gattgtgaca aaataaactt 1740 

SSocSac S2J t9 T " Cttttata tgttgcoaoc ttf tgt.tg tattttcgao IsOO 
gtttgctaac atactgcgta ataaggagtc ttaataagct tgacctgtga aqtaaaaaat 18 60 
9 ! gCgaCatt "ttttgtct googtttacc gctactgog? cacgg"c?c llll 
altltlltt 9 ta gcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 1980 
Ifaltlt 9 ********** agcgcccgct cctttogctt tcttcccitc ct?tctogcc 2040 
SS ° 9 gctttocccg toaagctcta aatcgggggc tccctttagg gttccga??? 2100 
t 9 t Wacctcg. cccoaaaaaa cttgattagg gtgatggt?c acgtagtggg 2160 

ccatogccct gatagacggt ttttcgocot ttgacgttgg agtccacgtt ctitaatlg? 2220 
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ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 2280 
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta llll 

!! t °S 9 ctaacaaaat attaaaaaac gcccggcggc aaccgagogt ta^gtgaa 2A00 

?£ctaatcc SS;S«S rS 9 ^* ttta ^ accc -ctttJJt ttaag'tgt? 
ttcctaatco gcatatgatc aattcaaggc cgaataagaa ggctgqctct acaccttaoi- oR 9n 

ScS;Sf a "? gatagct tgtcgtaata atggcggcat IctaSagta SStattt llll 
ccctttcttc tttagcgact tgatgctctt gatcttccaa tacgcaacct aaaotaSat 2640 
gccccactgc gctgagtgca tataatgcat tctctagtga aaaacctS tggcataaaa llll 

SKEES ScgcaKS ctt ttC r aCt gtttttct ^ aggccgt^a cSS^gS 27 S 
crrctgctcc atcgcgatga cttagtaaag cacatctaaa acttttagcg ttattacgta 2820 

J"cE?£S taSS: -ttctaaag ggcaaaagtg agtatgg^ cSSSE 2880 
gc£"ctlc S agcaaagccc gcttattttt tacatgccaa tacaatgtag 2940 

gcrgctctac acctagcttc tgggcgagtt tacgggttgt taaaccttcq attccaacct 30 on 
"" aa9 f ag ctcta atgcg ctgttaatca cttt. ctttt atctaaacga gacatcaS llsl 
attcctatta cgccccgccc tgccactcat cgcagtactg ttgtaattca ttaagcattc 3120 
tgccgacatg gaagccatca caaacggcat gatgaacctg aaLgcoagc ggca?"gca 3180 
ccttgtcgcc ttgcgtataa tatttgccca tagtgaaaac gggggcgaag aagttatcca 3240 
tattggccac gtttaaatca aaactggtga aactcaccca ggga?tggc? gagacgaaaa 33M 
acatattctc aataaaccct ttagggaaat aggccaggtt Jt'cac gL cacgccaca? llll 
T^lZXTo TatlltT aaCt9CC9ga aatc ^^g gt.ttcES cagagcg^tg 3420 
ccagcJcacc ^^aaacgg tgtaacaagg gtgaacacta tcccatatca 3480 

35 2=235 SSSS S~ ^o 0 

=2SE S3 cattSgata 3E=£ S~ g?g 

gcagSaSt Sttoaatat "f?""" *«*cat??a KagggtS t^ctcatga 3 ' 
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacattto 384n 

tlllllllll HiTT 5 3ttgta ^^ tt.ct.gttt .a gg gg^c? aggtgaaga? 390^ 
cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc 3960 
?S 3 gaaaa ^tca .aggatcttc ttgagatcc? ttttttctgc gc^aKSg 4olS 

acc2c g c aa a ? a cca aa r " co ? ot -?° ""W^* tgtttgccgg atLagagc? 40sS 
accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atactqtcct 4140 

cgct^ct 9 SctSta 9 ""T^" c "*"«*ct gtagcaccgc cUcaSo «5S 
? atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg 4260 
a9aCga * agt tacaggaf a ggcgcagcgg tcgggctgL cggggggSc 4320 

™- ~- SS=K S=K= Ss 2 

IE =s= ess: ssss ssS as 

SS2SS SS25£ SSKS SSKEi SSSS SES* JSS 
JJSiSS £££5 SaK 9ttat ttta — «« 

4765 

<210> 2 
<211> 4971 
<212> DNA 

<213> ktinstliche Sequenz 
<220> 

<221> pCAl/GFP24 Klonierungs- und Expressionsvektor 
<400> 2 

ctagataaga aggaagaaaa ataatgaaca ataacgatct ctttcaggca tcacqtcqqc 60 
gttttctggc acaactcggc ggcttaaccg tcgccgggat gctggggccg tcIt£?S£ JS 
aaalactcca g °r agCCgg -atggcggg Itemed ctagcfgacc ^80 

sS *™ ~™ ssss as 

i tSS 2KE2 t ^ t ~ a JJJ 

SS52S 2SSS 2E=2 s=E£ ~ ~ 
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ctgttccatg 
atccggatca 
aggaacgcac 
ttgaaggtga 
gaaacattct 
cagacaaaca 
cggcctcggg 
ggcccaaacc 
tgcaagctga 
acctgctgaa 
aacttaagcc 
gttattactc 
cggtggccgt 
actggcttcc 
gaaccacggc 
aatggcaaac 
tgacgctaaa 
cattggtgac 
taattcccaa 
tcaatattta 
taaaccatat 
gtttctttta 
taataaggag 
ttttttttgt 
gcattaagcg 
ctagcgcccg 
cgtcaagctc 
gaccccaaaa 
gtttttcgcc 
ggaacaacac 
tcggcctatt 
atattaacgc 
tgtttatttt 
atgcttcaat 
attccctttt 
gtaaaagatg 
agcggtaaga- 
aaagttctgc 
cgccgcatac 
cttacggatg 
actgcggcca 
cacaacatgg 
ataccaaacg 
ctattaactg 
gcggataaag 
gataaatctg 
ggtaagccct 
cgaaatagac 
atgtctcgtt 
ggaatcgaag 
ttgtattggc 
gataggcacc 
aataacgcta 
ttaggtacac 
tgccaacaag 
actttaggtt 
cctactactg 
ggtgcagagc 
cttaaatgtg 
tagtttaaaa 
cgtgagtttt 
gatccttttt 
gtggtttgtt 



gccaacactt 
tatgaaacgg 
tatatctttc 
tacccttgtt 
cggacacaaa 
aaagaatgga 
ggccgcagaa 
ttccaccccg 
aaccgaccag 
agagaaagag 
aaggaggaaa 
gctgcccaac 
atcgctcgtc 
accgctaaca 
ggttgtgcta 
gctaataagg 
ggcaaacttg 
gtttccggcc 
atggctcaag 
ccttctttgc 
gaattttcta 
tatgttgcca 
tcttaataag 
ctgccgttta 
cggcgggtgt 
ctcctttcgc 
taaatcgggg 
aacttgatta 
ctttgacgtt 
tcaaccctat 
ggttaaaaaa 
ttacaatttc 
tctaaataca 
aatattgaaa 
ttgcggcatt 
ctgaagatca 
tccttgagag 
tatgtggcgc 
actattctca 
gcatgacagt 
acttacttct 
gggatcatgt 
acgagcgtga 
gcgaactact 
ttgcaggacc 
gagccggtga 
cccgtatcgt 
agatcgctga 
tagataaaag 
gtttaacaac 
atgtaaaaaa 
atactcactt 
aaagttttag 
ggcctacaga 
gtttttcact 
gcgtattgga 
atagtatgcc 
cagccttctt 
aaagtgggtc 
ggatctaggt 
cgttccactg 
ttctgcgcgt 
tgccggatca 



gtcactactt 
catgactttt 
aaagatgacg 
aatcgtatcg 
ctcgagtaca 
atcaaagcta 
caaaaactca 
cctggttctt 
ctggaagacg 
aaactggaat 
ataaaatgaa 
cagcgatggc 
tggaagaaaa 
tgctgcgtga 
gcggtggcgg 
gggctatgac 
attctgtcgc 
ttgctaatgg 
tcggtgacgg 
ctcagtcggt 
ttgattgtga 
cctttatgta 
cttgacctgt 
ccgctactgc 
ggtggttacg 
tttcttccct 
gctcccttta 
gggtgatggt 
ggagtccacg 
ctcggtctat 
tgagctgatt 
aggtggcact 
ttcaaatatg 
aaggaagagt 
ttgccttcct 
gttgggtgca 
ttttcgcccc 
ggtattatcc 
gaatgacttg 
aagagaatta 
gacaacgatc 
aactcgcctt 
caccacgatg 
tactctagct 
acttctgcgc 
gcgtggctct 
agttatctac 
gataggtgcc 
taaagtgatt 
ccgtaaactc 
taagcgggct 
ttgcccttta 
atgtgcttta 
aaaacagtat 
agagaatgca 
agatcaagag 
gccattatta 
attcggcctt 
ttaaaagcag 
gaagatcctt 
agcgtcagac 
aatctgctgc 
agagctacca 



tctcttatgg 
tcaagagtgc 
ggaactacaa 
agttaaaagg 
actataactc 
acttcaaaat 
tctcagaaga 
caggcgcctg 
agaaatccgc 
tcattctggc 
atacctattg 
cgcacaggtt 
agttaaaacc 
acaggttgct 
ctccggttcc 
cgaaaatgcc 
tactgattac 
taatggtgct 
tgataattca 
tgaatgtcgc 
caaaataaac 
tgtattttcg 
gaagtgaaaa 
gtcacggatc 
cgcagcgtga 
tcctttctcg 
gggttccgat 
tcacgtagtg 
ttctttaata 
tcttttgatt 
taacaaaaat 
tttcggggaa 
tatccgctca 
atgagtattc 
gtttttgctc 
cgagtgggtt 
gaagaacgtt 
cgtattgacg 
gttgagtact 
tgcagtgctg 
ggaggaccga 
gatcgttggg 
cctgtagcaa 
tcccggcaac 
tcggcccttc 
cgcggtatca 
acgacgggga 
tcactgatta 
aacagcgcat 
gcccagaagc 
ttgctcgacg 
gaaggggaaa 
ctaagtcatc 
gaaactctcg 
ttatatgcac 
catcaagtcg 
cgacaagcta 
gaattgatca 
cataaccttt 
tttgataatc 
cccgtagaaa 
ttgcaaacaa 
actctttttc 



tgttcaatgc 
catgcccgaa 
gacgcgtgct 
tattgatttt 
acacaatgta 
tcgccacaac 
gaatctgtat 
cggtggcctg 
tctgcagact 
tgctcacggc 
cctacggcag 
aaactgctcg 
ctgaaagctc 
cagctgaagc 
ggtgattttg 
gatgaaaacg 
ggtgctgcta 
actggtgatt 
cctttaatga 
ccttatgtct 
ttattccgtg 
acgtttgcta 
atggcgcaca 
tccacgcgcc 
ccgctacact 
ccacgttcgc 
ttagtgcttt 
ggccatcgcc 
gtggactctt 
tataagggat 
ttaacgcgaa 
atgtgcgcgg 
tgagacaata 
aacatttccg 
acccagaaac 
acatcgaact 
ttccaatgat 
ccgggcaaga 
caccagtcac 
ccataaccat 
aggagctaac 
aaccggagct 
tggcaacaac 
aattgataga 
cggctggctg 
ttgcagcact 
gtcaggcaac 
agcattggta 
tagagctgct 
taggtgtaga 
ccttagccat 
gctggcaaga 
gcgatggagc 
aaaatcaatt 
tcagcgcagt 
ctaaagaaga 
tcgaattatt 
tatgcggatt 
ttccgtgatg 
tcatgaccaa 
agatcaaagg 
aaaaaccacc 
cgaaggtaac 



ttttcccgtt 
ggttatgtac 
gaagtcaagt 
aaagaagatg 
tacatcacgg 
attgaagatt 
ttccagggcg 
accgacaccc 
gaaatcgcta 
ggttgttaat 
ccgctggatt 
agagcgcttg 
agaactccga 
agaaagttat 
attatgaaaa 
cgctacagtc 
tcgatggttt 
ttgctggctc 
ataatttccg 
ttggcgctgg 
gtgtctttgc 
acatactgcg 
ttgtgcgaca 
ctgtagcggc 
tgccagcgcc 
cggctttccc 
acggcacctc 
ctgatagacg 
gttccaaact 
tttgccgatt 
ttttaacaaa 
aacccctatt 
accctgataa 
tgtcgccctt 
gctggtgaaa 
ggatctcaac 
gagcactttt 
gcaactcggt 
agaaaagcat 
gagtgataac 
cgcttttttg 
gaatgaagcc 
gttgcgcaaa 
ctggatggag 
gtttattgct 
ggggccagat 
tatggatgaa 
ggaattaatg 
taatgaggtc 
gcagcctaca 
tgagatgtta 
ttttttacgt 
aaaagtacat 
agccttttta 
ggggcatttt 
aagggaaaca 
tgatcaccaa 
agaaaaacaa 
gtaacttcac 
aatcccttaa 
atcttcttga 
gctaccagcg 
tggcttcagc 



600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
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lllltltill cacc°""a* JSSSS S'W ccaottcaag 
agtggcgata agtlgtgio? taJcggSw -JS"" 00 »«"•«>■»* ggctgctgc? 

=ss= fcsss SiS I™ =ss 

cgtcgatttt tataat-^l-„ ^ctcatagt cctgtcgggt ttcgccacct ctgacttgag 
gccttW'tac gg^ct'ggc SSSSE cSt?tacf gg \ aaaacgc cagcaacgc? 

=S SS525 S^S SI'S SE F— 

<210> 3 
<211> 4765 
<212> DNA 

<213> kUnstliche Sequenz 
<220> 

<221> PCN1/GFP24 Klonierungs- und Expressionsvektor 
<400> 3 

St 3 ?^ llllTe^l ££££ S^fl tCaCgtCggC 
cgccgcgacg tgcgactgcg gcccaaccaa S™* 5 g ° tggggcc g tcattgttaa 
attatcaaca aaaJactfca attggcga^g gcccfgtcc? ESf CtagCagacc 

3SSSS S SS= SSSK 

SSSS5 S=S S 252 52=32 

atccggatca Ltgaaacgg catgact?^ ^caaaaatal ! 9 " Caatgc ttttoccgtt 
aggaacgcac tatatctttc Baamt«r» ^caagagtgc catgcccgaa ggttatgtac 
ttgaaggtga tacccttatt 5 ggaactacaa gacgcgtgct gaagtcaagt 

gaLcStrt cggacaclaa ctcglgScf SiS"? 9 tattgatttt aaagaaga 9 g 
cagacaaaca aaagaatgga ScSagcS acScaaa^ aC3Caatgta tacatcacgg 
cggcctcggg ggccgcagaa caaJaal^ 3 a ^ tcaaaat tcgccacaac attgaagatt 

•tgcttgSS ?ggcaccS a a aa S g Sag S^SS Sac^** ttCCagggcg 96 ° 
ccgctctgca gactgaaatc actaaS ^gaaaccga ccagctggaa gacgagaaat 1020 

tggctgetca cggcggttgt gggSagSct iSIIS?" agagaaac ^ gaattcattc 1080 
gaaataccta tfgccLcgg cagcogSgg atta'tat'a 9 ° Caaggagg aaaataaaat 1140 
ggcaagcatc tgcggtggcc gtatcactca £££ " ctc ^ c ^ cac agccggccat 1200 
tcagaactcc gaaSggct? ccaccgctal ! aaa g"aaaa ccctgaaagc 1260 

gcagaaagtt Itgaa^cacg gcgg??gtgg SSSS H*^ 99 " 9 CtCagct * aa 1320 
tgattttgat tatgaaaaaa ? g SaaSc til?!! cta gcgggct ccggttccgg 1380 

tgaaaacgcg ctacagtctg acgc'aaagg caaactfca? 5'? M ?' aaaatgccga 1440 
tgctgctatc gatggtttca ttggtqaca? tctgtcgcta ctgattacgg 1500 

tggtgatttt gctggctcta a^cccaaS aactSS gc taatggta atggtgctac 1560 
tttaatgaat aat??ccgtc aatatSacc ggtgacggtg ataattoacc 1620 

ttatgtcttt ggcgctggta aaccatataa Itttt ? 2 Cagtc gg fct g aatgtcgccc 1680 
attccgtggt g?c?ttgcgt ttrtStaJa " gattgt * aca aaataaactt 1740 

gtttgctalc atactgcrta a^aaaaaXc ttttt " tatgtat g tattttcgac 1800 

ggcgcacatt gtgcgacatt SSSrtS ? 9 tgacctgtga agtgaaaaat 1860 

cacgcgccct gtagcggcgc attaa££2 15*^11°° gctact ^gt cacggatctc 1920 
gctacacttg ocagcgccc? agcjccc?c? S?E 9 ?? t^ ttac ^ cagcgtgacc 1980 
acgttcgccg gctttScca 2SSS??2 cc tttcgctt tcttcccttc ctttctcgcc 2040 
•gtgcttt.S ggcacctcga cccXSaaa SJSK? 90 «ttccg.ttt 2100 

ccatcgccct gltagacggt SttcgccS £2S2£2 gtgatggttc acgtagtggg 2160 
ggactcttgt tccaaactgg aacaacaS 2^T?H agtccac g tt ctttaatagt 2220 
taagggatit tgccga?t?c atclltlll* III c ggtctattc ttttgattta 2280 

aacgcgcatg caacgcSac 2S£S£ £££££ SfT, 3 acaaaaat " 2340 

yy ggcacrtttc ggggaaatgt gcgcggaacc 2400 



4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4971 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
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tga?aaa?gc Sa^af" aatatgtatc cgctcatgag acaataaccc 24 60 

sss3 asE S 3 -SSH isi; w ~ 

5= ~™ SS» !»N HSi Si E 

taccacgacg attt^ggca gSSIcac ata^t'cac tttC3t ^ Ct -tggagtgaa 2820 
gaaaacctgg cctattScc Kaagg^tt a£tqagaa?a ESS!""? g ^ttacggt 2880 
ccctgggtga gtttcaccao tt^n^^ attgagaata tgtttttcgt ctcagccaat 2940 

sssse itnidi it i H esse 3 3 ;is 
esse - " ~ s " s 

actcactttt gccctttaa; lalalttltt " agccat t g agatgttaga taggcaccat 3360 
agttttagat gtgctttact aaSca^cao t g * Caagatt "ttacgtaa taacgctaaa 3420 
cctacagaaa aacltlllTa a"ac£cW== ^atggagcaa aagtacattt aggtacacgg 3480 
ttttcactag agaSgca?? a?^acac?c aatCaat * ag ccttttftg ccaacaaggt 3540 
gtattggaag atcaacaaca itmt% t agcgcagtg 9 ggcattttac tttaggttgc 3600 
agtat^cgl caSKtlcg aca^ctKc ga 3 ^? 3 ? 3 3660 
gccttcttat tcggccttga attgltcata lllllttt 9 atcaccaa ^ tgcagagcca 3720 
agtgggtctt aaaagcagcJ taacc tm tltt^t t aaaaacaac t taaatgtgaa 3780 

S5 latScSga I f'f" £~ IIS 

2SSK = £ Li gS S55 JSS 

accaactctt tttccaaaao t aflr .t n ^ agcggtggtt tgtttgccgg atcaagagct 4080 
tctagtgtag ccg^agtt^ gc'ccactt oliZlTJ Cagataccaa a tactgtcct 4140 
cgctctgcta atcctgttac llalnn^ll ° aa 9 aa °tct gtagcaccgc ctacatacct 4200 
gttggactca agacgltaa? tlatll^ tgccagt S3 c gataagtcgt gtcttaccgg 4260 
gtg?acacag cccagStga agcaalcaae S° gCagcgg ^cgggctgaa cggggggt?? 4 320 
gctatgagal agcgccacgc Ctgaga * acc tacagcgtga 4380 

S523S ggg t ^ 3 d c £i F? - ™- SESK JiS 

ttg?tgacac fc^aSSg aSaa^ 3 ^ gaatgg " »*«tg«ttaa ttcctaatt? 4680 
gtgaaatgaa tagtSgaca aaaX* tttaccactc cctatcagtg atagagaaaa 4740 



<210> 4 
<211> 823 
<212> DNA 



<213> ktinstliche Sequenz 
<220> 

<221> reife TEM-1 p-Lactamase Klonierungskassette 



<400> 4 



ggcccagccg gccatggctc acccagaaac 
gttgggtgca cgagtgggtt acatcgaact 
ttttcgcccc gaagaacgtt ttccaatgat 
ggtattatcc cgtattgacg ccgggcaaga 
gaatgacttg gttgagtact caccagtcac 
aagagaatta tgcagtgctg ccataaccat 
gacaacgatc ggaggaccga aggagctaac 
aactcgcctt gatcgttggg aaccggagct 
caccacgatg cctgtagcaa tggcaacaac 
tactctagct tcccggcaac aattgataga 



gctggtgaaa gtaaaagatg ctgaagatca 60 
ggatctcaac agcggtaaga tccttgagag 120 
gagcactttt aaagttctgc tatgtggcgc 280 
gcaactcggt cgccgcatac actattctca 240 
agaaaagcat cttacggatg gcatgacagt 300 
gagtgataac actgcggcca acttacttct 360 
cgcttttttg cacaacatgg gggatcatgt 420 
gaatgaagcc ataccaaacg acgagcgtga 480 
gttgcgcaaa ctattaactg gcgaactact 540 
ctggatggag gcggataaag ttgcaggacc 600 
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acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 660 
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gataggtgcc tcactgatta agcattggtc ggcctcgggg gcc " 823 
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